DataFrame数据索引转换成列或列转换成数据索引

DataFrame数据集索引转换和重命名

DataFrame数据结构类型我们常见的excel表格一样,直观简单利于理解。
该数据集有行和列及索引的概念。
我们在数据操作中常常需要进行的对数据集进行分组统计之类。这时就很涉及到数据集改变之后数据索引也可能随之改变。

1.查看数据索引列

col_name = bin_df.index.name
print(‘col_name:’,col_name)
print(bin_df)
注:bin_df是数据集

在这里插入图片描述
发现索引列是我们关心的age列,需要将其转换成特征列,即:reset_index()

bin_df = bin_df.reset_index()
col_name = bin_df.index.name
print(‘col_name:’,col_name)
print(bin_df)

结果如下:发现age已经转换成特征列。

在这里插入图片描述
2.给数据集重新命名新的索引列

print(‘col_name:’, bin_df.index.name)
bin_df.index.name = ‘num’
print(bin_df)
print(‘col_name:’, bin_df.index.name)

结果如下:修改索引成功!
在这里插入图片描述
3.指定多个列作为多级索引

bin_df = bin_df.set_index([‘age’,‘woe’])
print(bin_df)
print(‘col_name:’, bin_df.index.names)

结果如下:需要注意的是多层索引名的输出时用的是bin_df.index.names

在这里插入图片描述
同时保留作为索引的列

bin_df = bin_df.set_index([‘age’,‘woe’],drop=False)
print(bin_df)
print(‘col_name:’, bin_df.index.names)

注:drop= False,在列中保留了作为索引的列,等于True时直接删除。

在这里插入图片描述
4. 使用rename方法:

DataFrame.rename(mapper = None,index = None,columns = None,axis = None,copy = True,inplace = False,level = None )
参数介绍:
mapper,index,columns:可以任选其一使用,可以是将index和columns结合使用。index和column直接传入mapper或者字典的形式。
axis:int或str,与mapper配合使用。可以是轴名称(‘index’,‘columns’)或数字(0,1)。默认为’index’。
copy:boolean,默认为True,是否复制基础数据。
inplace:布尔值,默认为False,是否返回新的DataFrame。如果为True,则忽略复制值。

  • 13
    点赞
  • 56
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值